英特尔宋继强:神经拟态芯片取得重大突破,对AI有何意义?
The following article is from 中国电子报 Author 李佳师
本文转载自中国电子报
上周英特尔放出两个重磅消息:其一是3月16日英特尔与康奈尔大学利用英特尔神经拟态芯片Loihi来识别爆炸物等危险化学品气味的研究,取得重大的突破。其二是3月19日英特尔用768个Loihi芯片构造了一个新的神经拟态研究系统Pohoiki Springs,这个系统达到了1亿个神经元的规模,而上一次构建的系统Pohoiki Beach是64个芯片800万个神经元,这次扩大了12倍。
在这两个重磅消息的背后释放出许多重要的信号,人类对于除视觉、听觉之外的味觉、嗅觉等研究有新突破,带来新想象空间和应用空间,人类对大脑的认知以及类脑芯片、AI芯片又跨上新台阶,未来的芯片发展之路又有可能另辟蹊径。这一切、一切的背后有诸多信息需要解密。为此,《中国电子报》记者连线采访英特尔中国研究院院长宋继强。
嗅觉和味觉AI为什么远比视觉和听觉AI要落后?
我们知道人类在视觉、听觉识别方面相对成熟,但在味觉、嗅觉等方面识别仍面临很多挑战。而这次英特尔与康奈尔在气味和爆炸物识别上的合作有什么突破意义?关于味觉、嗅觉识别的主要挑战是什么?通常采用什么样的路径来解决这类问题?
”宋继强表示,人类的味觉靠舌头、嗅觉靠鼻子,目前为止,人工智能做得比较好的是视觉、听觉,两个人类主要感官。之所以在这两个领域做的比较好,有几个原因,其一是视觉、听觉两类数据相对容易获得而且数据量大。在此前的信息化时代,比如2000年开始摄像头普及,更早时候麦克风普及,让我们积累了大量图片数据和语音数据。其二是这两类数据的标注相对容易。人类基于捕捉下来的照片或是录制的音频进行标注,基于人类的基本认知知识容易实现,容易确定它的正确与否。
“而深度学习之所以能够获得现在的效果是因为几个关键:第一数据量足够,第二有标注好的数据,第三是要保证训练的数据集和未来要处理的问题的测试数据集的分布是一致的,这样训练出来的模型,才能够很好地处理真实的场景。”宋继强表示,这也是为什么我们看到深度神经网络擅长处理视觉数据、语音数据的原因。
而嗅觉和味觉,目前的数据非常少,而且没有很好的标注。究竟谁可以将这些数据进行标注,非得是专家在实验室才可以进行。比如葡萄酒的品酒,同一款葡萄酒十个专家来品尝可能会有不同的结果,同一款葡萄酒让同一个专家在不同的时间段品,也可能打出不同的分。所以它有难度。
“数据量不够多,而且主观评测标准也不够。味觉的差异性太大,嗅觉相对客观一些,因为嗅觉本身是依据不同的气味,主要源于空气中包含的一些化学分子的成份不同、密度不同。人的鼻子、动物的鼻子、电子鼻对于气味的区分能力不一样。普通人能够区分三四百种不同气味,稍加训练可以达到上千种、数千种,但现实中真正可以区分的气味其实是在万种以上,这些气味我们日常很难拿到大量数据,所以它绝对是小数据量的场景。”宋继强说。
但嗅觉数据的使用场合非常多,比如爆炸品的检测,生活中危害、有害气体的提早检测,对水果或农作物的成熟度检测,对检修污染的检测等,靠气味能够检测的非常多。目前因受限于数据量不够充分,检测手段不够高明,嗅觉AI的发展比视觉和听觉落后非常多。
为什么用神经拟态计算而不是其他计算?
我们知道人工智能发展有三个关键:数据、算法、算力,为什么解决嗅觉、味觉等问题上要采用类脑计算,而不是其他的计算来解决这些问题?神经拟态计算比其他计算解决此类问题有什么优点?用量子计算是不是也可以很好地解决此类问题?
”宋继强表示,神经拟态计算的优势在于,第一,不需要依赖于大量的数据。神经拟态计算从一个样本的训练中就可以达到百分之九十多的相对比较高的准确率,这和过去人们专门去定制一些规则特征来识别的效果非常相似。人订立规则的意思是,假如我知道这个气味由哪几种分子构成,比如二氧化硫是臭鸡蛋味,我就可以知道这其中什么样的分子会导致臭鸡蛋味,可以定制一些化学传感器、其他的有机物传感器来指定检测这两种特定的分子构成,然后标注成这是二氧化硫的气味。但神经拟态芯片不需要人做这样的划分,而是直接取出来。这张Loihi识别模型图很好地解释了神经拟态芯片做这件事情的机理。
它从人脑做嗅觉识别的过程获得启发,人是通过鼻腔让空气吸进来,如果想更快甄别味道,可能要快速呼吸几下,让它的浓度、流动的速度都加快起来,接触到更多气味。所以它是让空气流动和鼻子里的传感细胞接触。这张图里还显示出传感细胞分成几种、每种的构造以及不同的感知细胞。然后连到底下的感知神经元,感知细胞相当于我们在构造电子鼻时,放了一些化学传感器或者有机物传感器。这样我们就构造出一个类似于人的鼻腔通道,感知气体流过它的分子接触,传感细胞时间的、空间的序列,构造出一个阵列一样的传感器的组合,就可以在气味经过的时候形成一个时间上的脉冲序列,然后它有空间上的分布。这就与人的嗅觉系统的感知机理比较接近。
同时因为人脑里是靠神经元机制形成刺激-激励,形成以后要在神经元里累积,累积以后要去释放,这就与神经拟态系统怎么用SNN模型,也就与脉冲神经网络的模型去模拟它相关。所以神经拟态芯片是比较容易让人们构造的一个模型,包含对时间和空间序列处理的一个模型,然后放在它上面,对数据进行模式的匹配。通过这一测试能把它的模式很好地记录下来,记录下来之后再碰到这样一个气味就能够产生最高响应。同时为了不要让其他可能的气味误识,这个阵列需要构造得比较大,上面传感细胞的传感器种类要更多。
“从这个工作图上我们看到了它从理论到实践的基础,以及可以扩展识别更多种类气体的扩展化的路径。”宋继强说,神经拟态芯片解决了在低成本、数据量很少、功耗很低的背景下闻味的问题。因为在一个Loihi芯片上构造这样的系统,它的功耗非常低,功耗只是毫瓦级别,无论是训练还是识别都不需要花太多电,所以可以把它做成类似于“电子鼻”的小设。而且它可以扩展去识别很多种类的气体。
那么量子计算等其他计算是否能够拥有与神级拟态计算一样的解题能力?
宋继强表示,当然也可以用传统计算机来解题,但如果是传统计算机就需要构造更精巧的算法,在传统的CPU上当然可以模拟各种各样的计算场景,但是执行效率肯定不如在Loihi上这么直接、这么低功耗。而量子计算适合做大规模有并行选项同时验证的事情,并不适合做嗅觉识别,因为嗅觉识别需要针对只有少量的、有时间序列的数据,进行快速判别。
Pohoiki Springs难在哪里?有什么突破意义?
英特尔这次公布的新系统Pohoiki Springs研发难度有多大?与上一代的系统相比有哪些突破?这些突破有什么意义?
”宋继强表示,Pohoiki Springs是在上一代Pohoiki Beach的基础上继续进行大规模的互联。首先把互联的规模加大,加大后面临几个问题:
第一互联之后怎么保证这些信息的传递,我们知道在一个64芯片的Pohoiki Beach板级方案上,所有芯片之间的连接是在一块电路板上,所以它们之间的速度是比较一致,很有保障。当我们把12倍的板子连起来时,就要增加更多的I/O连接组建和信息传递协议的处理,如何保证信息传递的有效和时效性。
第二是在上面支持软件开发的时候,要更好地把硬件连接差异掩盖掉,让大家非常容易使用,就像使用一个大脑组织一样,不同的分区可能有不同功能的组合,实现灵活分区使用,这需要一个分布计算的软件层支持,所以这一层也比较关键。
第三是这上面要开发一些新模型也会涉及到更大规模的模型的设计和处理,这也比在小芯片上要困难。
它的难度分为三层,一是底层如何把这么多块芯片互连起来,把它全部连接起来同时要保证连接的有效性和时效性,这在业界没有做过。二是软件层,要支持互连计算、分布式计算和灵活分区,这也是没有人做过的。三是支持更大规模的做动态规划和优化的实验,这也是英特尔首先做的。
为什么要做这样一个大规模的系统?宋继强表示,因为在很多领域的应用里做优化、约束满足、动态规划时,需要耗费很多时间、消耗很多电力,而切换算法在神经拟态芯片Loihi上做可以更快、功耗更低。
类脑计算何时真正接近于人脑?
计算机在不断接人脑的维度上,目前走到了哪一步?如果我们用小溪、小河到大海来形容现在走到了哪一个程度?还要突破哪些屏障才能真正走到大海?
”“这比较难给出确切答案。”宋继强说,一方面因为人类对于大脑的了解和认知进展并不像摩尔定律那样高速,它的进展非常缓慢。现在对于神经元结构基本了解,对于某些人的感知机理也有了解,特别是对视觉、听觉、嗅觉这些比较重要的感知机理有所了解,但其他更深层次的感知、认知是怎么形成依然不了解。不过现在Loihi设计用的比较复杂的脑神经元的工作模型,这是我们首先可以借鉴的。另一方面在器件上,人脑的工作方式和传统半导体的工作机理也并不完全一样,所以我们也在做新的底层器件研发,比如忆阻器,既可以存储也可以计算的一种器件。
不过,宋继强进一步表示,除了我们对人脑的认知机制与工作机制的了解需要继续推进,我们还需要换一个维度,超出人脑来看IT能够带来什么。“我们说人脑很神秘、很厉害,但是毕竟是一个生物组织,有它的极限。我现在手里有一个更强的武器比如IT、半导体、量子计算等工具,它会有比人脑更强的能力。”如何利用这些东西、利用这些芯片与人脑的研究相结合、跨学科结合就能够更好地往前推进。
“最重要的是需要找到很好的应用导向。”宋继强表示,比如英特尔对于Loihi研究,Loihi的主要贡献一方面是新的架构设计,它实现了大规模集连,而且把工具链做起来了。另一方面是Loihi构建了一个社区(英特尔神经拟态社区INRC),社区中不仅有所类脑神经拟态计算研究的学术机构,也吸纳进来非常多不同种类的创业公司、五百强企业,希望通过探索看看这样的神经拟态计算能够很好地解决哪些应用领域问题,由此来驱动神经拟态计算的发展。就像2012年深度学习在学术界崭露头角之后,于2016、2017年大规模使用于安防领域、生物认证领域、金融领域等产业,以这样的发展路径能够形成从技术到规模化应用的生态。
“这是一个并行发展而不是线性发展的事情,所以很难给你一个预测时间。” 宋继强同时表示神经拟态芯片在英特尔的芯片布局中属于研究测试芯片,不是一个产品芯片,主要是在服务研究社区。未来如果有更大规模的商业应用场景,不排除将其通用化。
本文仅代表媒体观点
文中图片等素材的版权归其所有者拥有
相关资讯
你在看吗?